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1 简介 


开源 、 共 享 和 协同 的 软件 开发 模式 促进 了 互联 网 、 人 工 智 能 等 领域 繁 业 发 展 ， 但 在 这 种 模式 下 软件 开发 的 复杂 性 
日 益 增 加 ， 体 现在 依靠 大 量 开发 者 共同 开发 一 个 软件 、 频 繁 调用 第 三 方 代码 库 以 及 管理 维护 庞大 的 整体 代码 量 。 这 种 
复杂 的 软件 开发 模式 导致 了 在 开发 层面 很 大 概率 会 引入 安全 漏洞 。 侈 如 软件 开发 者 不 可 避免 地 需要 调用 第 三 方 代码 库 ， 
却 缺乏 对 第 三 方 代码 库 的 安全 性 的 保证 ， 导 致 了 由 于 调用 不 可 靠 的 第 三 方 代码 库 引 入 了 可 以 被 攻击 者 利用 的 漏洞 ， 带 
来 信息 泄漏 和 得 改 的 风险 。 一 旦 一 个 经 常 使 用 的 第 三 发 库 发 现 漏洞 ， 受 影响 的 往往 是 大 量 使 用 这 个 库 开 发 的 软件 。 
软件 安全 漏洞 中 最 主要 是 内 存 访问 漏洞 。 针 对 这 些 内 存 访问 漏洞 带 来 的 软件 安全 挑战 ， 学 术 界 和 工业 界 提出 了 一 
系列 软 硬 件 内 存 防护 方法 。 这 些 防 护 方法 一 方面 通过 数据 流 完整 性 技术 (Data Flow Integrity， 简 称 DFI)， 对 非 可 信 
的 软件 代码 的 数据 流 进行 严格 的 检查 和 限制 ， 通 过 对 数据 边界 的 越界 检查 或 者 数据 来 源 的 合 规 性 检查 等 来 防止 对 内 存 
的 非法 操作 。 这 其 中 代表 性 的 工作 包括 工业 界 中 Intel 公司 提出 的 MPX 和 MPK 技术 、ARM 公司 的 MTE 技术 以 及 
英国 剑桥 大 学 主导 的 CHERI 安全 体系 结构 等 。 男 一 方面 通过 控制 流 完整 性 技术 (Control Flow Imtegrity ， 简 称 CFT) 
来 防止 恶意 的 控制 流 支持 , 例如 Intel 的 CET 技术 、ARM 公司 的 BTI 技术 和 PA 等 技术 。 但 是 这 些 内 存 防护 方法 不 
同 程度 地 存在 着 隔离 划分 对 象 粒度 过 粗 、 安 全 元 数据 容易 遭受 攻击 或 者 硬件 实现 /性 能 开销 过 大 以 及 需要 对 现 有 第 三 
代码 进行 大 幅 修改 和 重新 编译 的 问题 。 
我 们 提出 了 DASICS 安全 处 理 器 设计 方案 ， 以 解决 现 有 安全 防护 技术 的 隔离 对 象 粒度 过 粗 、 元 数据 安全 性 低 、 人 性 
二 能 开销 过 大 的 问题 ， 并 关注 先前 工作 较 少 关注 的 权限 动态 划分 、 同 一 级 地 址 空间 内 的 内 存 保护 和 器 层 调用 检查 。 实 现 
, 它 一 种 基于 代码 片段 做 权限 动态 划分 的 安全 处 理 器 设计 ， 提供 硬件 铺 助 的 高 效 软件 内 存 防护 保障 第 三 方 代码 的 安全 调 
区 用 和 运行 ， 为 基于 开源 开放 的 软件 开发 提供 坚实 的 安全 保障 和 支撑 
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如 今 许多 底层 软件 (例如 操作 系统 、 网 络 协 议 栈 等 )、 高 性 能 第 三 方 库 (例如 SQLite、ASL、Crypto+ 十 、Qt 等 ) 
都 基于 非 内 存 安全 的 C/C++ 语言 开发 。 其 中 有 不 少 第 三 方 库 都 存在 潜在 的 内 存 访 问 漏洞 。 比 如 曾经 发 现 过 的 存在 堆 
缓冲 区 溢出 漏洞 的 XML 解析 库 libxml2、 有 远程 代码 执行 漏洞 的 HTML 代码 过 滤 库 htmlawed 以 及 有 缓冲 区 溢出 漏 
洞 的 开源 反 恶 意 软 件 工具 包 ClamAV 。 软 件 开发 者 在 使 用 这 些 第 三 方 库 时 ， 往 往 忽略 了 这 些 库 代 码 本 身 的 一 些 非 安 全 
特性 (例如 不 对 程序 的 输入 进行 边界 检查 等 )， 而 导致 基于 这 些 库 开发 的 软件 存在 可 以 被 利用 的 安全 漏洞 ， 造 成 信息 泄 
漏 和 算 改 等 严重 的 软件 安全 问题 。 
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图 1: Chrome 浏览 器 安全 漏洞 统计 
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王 误 或 恶意 攻击 ， 导 致 访问 或 修改 了 未 被 授权 的 内 存 区 域 ， 从 而 可 旬 


内 存 访问 漏洞 是 当下 软件 安全 问题 的 主要 威胁 。 所 谓 的 内 存 访 问 漏 洞 是 指 程序 在 对 内 存 进行 操作 时 ， 由 于 编程 错 


6 破坏 程序 的 正常 运行 ， 甚 至 导致 系统 崩 演 或 被 攻击 


利用 。 常 见 的 内 存 访 问 漏洞 包括 缓冲 区 溢出 、 使 用 未 初始 化 的 内 存 、 空 指针 引用 、 堆 溢出 等 等 。 这 些 漏 洞 可 能 导致 
(CG 程序 册 演 、 数 据 丢 失 、 系 统 崩 演 、 信 息 泄漏 等 安全 问题 ， 给 系统 带 来 极 大 的 风险 。 图 1 给 出 了 Google 统计 的 chrome 
谷歌 代码 库 中 较 难 修复 的 安全 漏洞 的 来 源 ， 统 计 显示 其 中 36.1% 的 漏洞 威胁 来 自 于 Use-after-free 攻击 ， 主 要 是 由 不 
-正确 的 内 存 管理 造成 的 内 存 室 x 间 释 放 后 再 利用 而 导致 的 漏洞 ; 32.9% 来 源 于 溢出 攻击 等 其 他 安全 问题 。 从 统计 的 安全 


Oj 上 看 ， 大 概 有 96% 的 漏洞 是 内 存 访问 漏洞 。 


第 三 方 库 代码 里 典型 的 内 存 访 问 漏洞 产生 的 主要 原因 ， 是 没有 对 非 可 信 的 代码 进行 可 访问 数据 的 边界 检查 ， 以 及 
没有 对 程序 的 控制 流 进行 检查 。 例 如 加 密 程序 库 OpenSSL 1.0.1 版 本 之 前 出 现 的 Heartbleed 漏洞 (CVE-2014-0160)， 
该 库 在 传输 层 (TLS) 协议 中 实现 了 心跳 检测 (Heartbeat) 机 制 时 ， 没 有 对 输入 的 长 度 进行 验证 〈 即 缺少 边界 检查 )， 
导致 攻击 者 可 以 利用 这 个 漏洞 对 客户 /服务 器 进行 Overread Buffers 攻击 ， 造 成 关键 信息 的 泄漏 ， 影 响 范 围 广泛 。 对 一 
些 更 为 严重 的 内 存 漏 洞 ， 攻 击 程序 可 以 利用 漏洞 进行 指令 执行 地 址 的 改写 ， 使 得 程序 的 控制 流转 移 到 攻击 者 控制 代码 


上 ， 从 而 可 以 进行 进一步 更 灵活 和 更 具 威 胁 性 的 攻击 ， 甚 至 具有 了 


图 灵 完 备 性 的 能 力 。 


通常 第 三 方 代码 库 和 软件 开发 者 自 研 的 代码 运行 在 同一 个 进程 地 址 空间 内 ， 因 此 第 三 方 代码 的 漏洞 很 容易 影响 到 
整体 程序 的 安全 。 对 于 用 C/C++ 等 不 内 置 内 存 安 全 检查 的 语言 编写 的 程序 ， 理 论 上 每 一 行 代码 都 可 以 不 受 限 制 的 直 
接 访 问 进程 地 址 空间 内 的 任何 位 置 。 一 旦 第 三 方 代码 的 漏洞 被 攻击 者 利用 ， 就 可 以 很 容易 的 访问 到 进程 地 址 空间 内 的 
任意 数据 和 代码 ， 窍 取 或 修改 数据 ， 其 至 支持 程序 并 进一步 进行 操作 系统 提 权 尝试 。 而 操作 系统 内 核 里 的 第 三 方 驱 动 


的 漏洞 一 旦 被 利用 ， 则 可 以 访问 到 整个 系统 的 内 存 。 
现 有 的 针对 内 存 访问 漏洞 防护 的 研究 工作 大 致 分 为 两 个 方向 : 


一 方面 从 数据 流 的 角度 关注 于 如 何 高 效 地 对 软件 进 


行 区 域 划分 并 在 划分 基础 上 进行 边界 检查 。 区 域 划 分 和 边界 检查 限制 了 某 些 代码 只 能 访问 自己 的 数据 不 能 越界 访问 其 


他 代码 的 数据 ， 比 如 函数 A 不 能 通过 栈 溢出 修改 上 一 级 函数 的 局 部 变量 。 另 一 方面 从 控制 流 的 角度 进行 跳 转 限制 ， 比 
如 函数 A 返回 的 时 候 如 果 返 回 地 址 不 是 原来 调用 后 的 地 址 就 需要 触发 例外 防止 不 合法 的 跳 转 。 不 同 的 安全 防护 方法 在 
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完备 性 、 易 用 性 和 性 能 开销 等 方面 具有 不 同 的 特点 ， 在 实际 的 系统 设计 选择 时 需要 进行 仔细 权衡 。 
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3 相关 工作 对 比 


针对 内 存 安全 问题 的 防御 机 制 可 以 分 类 为 纯 软 件 方法 和 软 硬 件 协同 的 方法 。 纯 软件 的 方法 可 以 从 编程 语言 、 编 译 
器 以 及 加 载 器 等 不 同 的 层面 进行 防护 。 而 软 硬 件 协同 的 方法 包括 构造 程序 运行 的 可 信 执 行 环境 、 以 及 在 程序 内 部 进行 
的 地 址 空间 隔离 和 控制 流 保护 等 方法 。 


3.1 纯 软 件 方法 


纯 软 件 的 防御 方法 可 以 从 各 个 层面 进行 防护 。 编 程 语言 方面 ,如 果 采 用 例如 Rust 等 内 存 安全 语言 对 非 可 信 代 码 进 
行 重 写 ， 可 以 解决 大 部 分 内 存 访问 漏洞 问题 。 然 而 这 种 方法 面临 着 极 大 的 实用 性 困难 ， 因 为 种 类 繁多 、 代 码 庞杂 的 第 
三 方 库 都 进行 从 C/C++ 到 Rust 等 安全 语言 的 移植 无 疑 是 一 个 工程 量 巨大 的 工作 。 

编译 器 方面 ， 通 过 对 源 代 码 插 和 人 一些 实 时 检查 代码 ， 可 以 防护 运行 时 的 越界 行为 。 例 如 GCC 和 clang 上 已 实现 的 

Stack Protector 技术 ， 主 要 通过 在 函数 调用 时 设置 一 个 栈 保护 变量 ， 并 在 函数 返回 时 检查 其 是 否 被 自 改 来 防止 针对 栈 
的 攻击 。 另 一 种 是 微软 C/C++ 编译 器 已 经 开始 支持 的 AddressSanitizer(ASan) 编译 器 插件 ， 它 可 以 在 编译 时 将 检测 
代码 注入 到 目标 程序 中 ， 并 在 运行 时 检测 内 存 错误 。 

在 程序 加 载 时 ， 主 要 使 用 地 址 空间 随机 化 技术 (Address Space Layout Randomization， 简 称 ASLR) 进行 防御 。 
”ASLR 是 是 一 种 针对 利用 内 存 漏 洞 进行 代码 跳 转 攻击 的 安全 保护 技术 ， 其 基本 思想 是 通过 对 堆 、 栈 、 共 享 库 映射 等 线 
三 隆 区 布局 的 随机 化 ， 让 攻击 程序 无 法 找到 确切 目标 代码 位 置 ， 从 而 增加 攻击 者 预测 目的 地 址 的 难度 。 
软件 对 于 控制 流 的 保护 主要 依赖 CFI 技术 ， 该 技术 首先 通过 静态 分 析 程序 源码 或 二 进 制 码 分 析 刻 画 程序 的 控制 流 
(control-flow-graph, CFG) ， 并 在 程序 运行 时 通过 监测 程序 控制 流 是 否 始终 处 于 CFG 中 来 判断 程序 是 否 遭 受 攻击 。 
CCFG 是 一 个 图 ， 由 基本 块 和 有 向 边 组 成 。 每 个 基本 块 代表 一 段 连续 代码 ， 其 中 不 包含 控制 流 跳 转 指令 和 其 他 控制 流 跳 
一 转 指令 的 目标 。 每 条 有 向 边 代表 程序 控制 流 的 一 次 转移 。 

记 、” 纯 软件 方法 虽然 已 经 能 够 提供 一 定 的 安全 防御 , 但 是 由 于 需要 进行 代码 插 桩 (例如 ASan 等 方法 ) 等 方式 , 在 访 存 

人 前 后 添加 检查 代码 导致 显著 降低 了 原本 软件 运行 的 性 能 。 同 时 需要 对 安全 元 数据 自身 进行 保护 的 机 制 例 如 CPG 检 

一 查 控制 流 方法 ) 也 必须 保证 这 些 用 于 安全 判断 的 安全 元 数据 不 会 被 攻击 者 自 改 和 伪造 。 

3.2 可 信和 执行 环 境 

>< 可 信 执 行 环境 (Trusted Execution Environment, TEE) 是 一 种 基于 软 硬 件 协同 的 安全 架构 , 它 通 过 时 分 复 用 CPU 

人 或 者 划分 部 分 内 存 地 址 作为 安全 空间 ， 构 建 出 与 外 部 隔离 的 安全 计算 环境 ， 并 通过 硬件 隔离 、 加 密 或 者 完整 性 验证 保 

- 忆 障 恶意 程序 无 法 从 环境 外 部 读 取 和 算 改 内 部 的 数据 和 控制 流 ， 从 而 提高 系统 的 安全 性 和 私密 性 。TEE 在 手机 、 云 计算 

C0 等 领域 得 到 了 广泛 应 用 。 这 其 中 的 代表 性 技术 是 Intel 的 SGX 安全 技术 、AMD 公司 的 SEV-SNP 安全 虚拟 化 技术 技 
术 、ARM 架构 上 的 的 CCA 机 密 计 算 技 术 和 Trustone 处 理 器 安全 隔离 技术 、RJISC-V 架构 上 的 Penglai 和 Keystone 
等 。 

特定 的 TEE 技术 需要 依赖 于 特定 的 体系 结构 或 者 平台 ,增加 了 设备 更 换 和 软件 移植 的 成 本 。 同 时 TEE 为 了 维护 

计算 环境 的 安全 性 , 需要 设置 大 量 的 硬件 资源 (比如 用 默 克 尔 树 等 方式 保障 内 存 数据 完整 性 ) 来 完成 保护 。 通常，TEE 
内 部 的 程序 和 TEE 外 部 的 数据 交互 的 开销 是 比较 大 的 , 同时 安全 环境 的 创建 和 切换 的 性 能 开销 也 不 容 忽视 。 因此 TEE 
适合 运行 相对 独立 的 小 规模 的 安全 核心 代码 ， 而 不 太 适 合 需 要 频繁 交互 的 场景 。 理 论 上 ， 把 一 个 大 型 的 应 用 程序 完全 
运行 于 TEB 内 部 也 是 可 行 的, 但 是 大 型 程序 内 部 多 个 模块 之 间 的 隔离 ， 特 别 是 对 第 三 方 库 的 隔离 是 TEE 功能 没有 考 
虑 的 。 


3.3 地址 空间 安全 隔离 


除了 可 信和 执行 环境 (TEE) 等 针对 软件 外 部 提供 的 隔离 保护 之 外 ， 还 需要 针对 软件 内 部 的 威胁 (例如 非 可 信 的 第 
三 方 代码 库 ) 进行 防护 。 假 设 软 件 内 部 没有 进行 代码 之 间 的 隔离 。 所 有 代码 都 是 相同 的 权限 ， 任 意 代码 都 可 以 访问 地 
址 空间 内 的 任意 数据 并 跳 转 到 同一 地 址 空间 内 的 任意 其 他 代码 ， 那 么 一 些 非 可 信 的 代码 将 会 以 此 对 软件 处 理 的 私密 数 
据 (例如 用 户 密码 ) 等 进行 窃取 。 甚 至 还 会 跳 转 到 恶意 的 攻击 代码 进行 更 具 威 胁 性 的 攻击 。 因 此 软件 内 部 也 需要 根据 
不 同 的 代码 进行 权限 的 划分 和 访问 以 及 跳 转 区 域 的 隔离 。 
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软件 内 部 防护 技术 需要 对 软件 内 部 的 代码 片段 进行 权限 划分 ， 同 时 对 非 可 信 的 第 三 方 库 需 要 进行 访问 内 存 的 限制 
和 跳 转 目标 的 限制 ， 以 防止 越界 访 存 入 改 私密 数据 ， 同 时 防止 控制 流动 持 路 转 到 恶意 代码 进行 自 改 。 因 此 可 以 从 数据 
访问 隔离 和 控制 流 保护 两 个 方面 对 软件 内 部 的 防护 技术 进行 分 类 。 


© [软件 外 部 防护 : 进 各 
软件 内 部 代码 片段 间 的 细 粒 度 隔 离 抽象 、 en TEE 


x—9 
来自 其 他 恶意 软件 、 总 线 、 外 设 
或 者 特权 系统 的 攻击 


一 名 
| ”外 部 内 存 区 域 


利用 内 存 区 域 越界 的 攻击 


图 2: 来 自 软件 内 部 非 可 信 库 的 威胁 


数据 流 完整 性 技术 (Data Flow Integrity, 简称 DFI) 的 思路 主要 是 通过 对 软件 内 部 不 同 代 码 允 许 访 问 的 数据 进行 


习 划 分 和 隔离 ， 同 时 在 进行 访 存 时 根据 这 个 隔离 的 规则 对 访 存 进 行 检查 ， 防 止 越界 访问 和 非法 操作 ， 以 阻止 对 敏感 数据 
CC 让 等 关键 信息 的 窃取 和 自 改 。 根 据 划分 的 方式 不 同 ，DFI 方法 还 可 以 进一步 分 为 针对 指针 附加 权限 和 针对 内 存 数据 附加 
CR 限 。 


A ”对 指针 附加 权限 的 代表 性 技术 包括 MPX 和 CHERI 等 ， 主 要 思想 是 规定 每 个 指针 访问 的 范围 以 及 对 指针 指向 的 


加 


-数据 所 允许 的 操作 ， 在 使 用 指针 进行 访 存 时 根据 这 些 规定 进行 检查 。 


SZ MPX (Memory Protection Extensions) 是 Intel 公司 开发 的 一 种 用 来 防止 内 存 访问 漏洞 硬件 扩展 技术 。MPX 增 


Ci 了 4 个 128 位 的 界限 寄存 器 ，4 条 限界 地 址 设置 和 比较 指令 ，4 条 限界 寄存 器 的 移动 指令 ， 两 个 配置 寄存 器 和 1 个 


.全 伏 态 寄存 器 。 在 程序 执行 时 ，MPX 通过 检查 指针 引用 ， 判 断 对 该 指针 的 引用 是 否 超出 了 预 设 的 范围 ， 从 而 提高 代码 的 


安全 性 。 因为 限界 寄存 器 有 限 ， 所 以 更 多 的 指针 限界 元 数据 必须 为 存放 在 内 存 的 一 个 表 中 。 使 用 这 种 技术 由 于 需要 对 
“第 三 方 库 都 进行 重新 修改 编译 ， 软 件 修改 代价 很 大 ， 且 软件 对 每 一 条 访 存 指令 进行 代码 插 桩 比较 ， 带 来 严重 的 性 能 


降 。 众 多 的 问题 让 Intel 于 2019 将 MPX 技术 从 x86 扩展 中 移 除 。 

CHERI (Capability Hardware Enhanced RISC Instructions) 是 另外 一 种 软 硬 件 协同 的 内 存 防 护 技 术 。CHERI 技 
术 通 过 扩展 指针 的 语义 ， 将 原来 地 址 长 度 的 指针 扩展 为 128 位 包含 这 个 指针 有 效 范围 、 权 限 、 是 否 有 效 等 信息 的 扩展 
指针 (Capability)。 并 添加 专用 的 指令 修改 扩展 指针 信息 。CHERI 可 以 实现 指针 级 别 的 内 存 安 全 保护 ， 理 论 上 能 够 防 
御 大 多 数 游 出 攻击 。 但 是 CHERI 的 扩展 指针 使 得 这 项 技术 的 访 存 开销 十 分 巨大 。 同 时 它 要 求 插入 修改 扩展 指针 的 命 
令 ， 导 致 需要 编译 器 的 大 量 修改 以 及 第 三 方 库 代 码 的 重新 编译 。 

对 数据 附加 权限 的 代表 性 技术 包括 MTE 和 PKU 等 , 主要 通过 对 内 存 数据 区 域 进行 标记 (tag) 进行 数据 隔离 , 代 
码 通过 持 有 这 些 标记 来 明确 对 对 应 内 存 区 域 的 访问 权限 。 

MTE (Memory Tagging Extension) 技术 是 ARMv8.5-A 架构 中 引入 一 种 内 存 保 护 机 制 ， 它 使 用 tag 将 内 存 分 成 
多 个 64 字 节 的 部 分 ， 并 为 每 个 部 分 分 配 一 个 唯一 的 tag。 这 些 tag 与 指针 一 起 使 用 ， 以 验证 指针 是 否 指向 正确 的 内 存 
位 置 。MTE 主要 通过 使 用 这 些 硬件 tag 来 执行 内 存 保护 ， 而 不 需要 对 代码 进行 任何 修改 。 此 外 ，MTE 还 提供 了 软件 
tag 功能 ， 以 允许 应 用 程序 通过 多 种 tag 方案 自 定义 tag， 包 括 基 于 地 址 的 标记 和 基于 随机 数 的 标记 。 它 还 提供 了 多 个 
标记 宽度 选项 ， 以 平衡 标记 的 数量 和 标记 带 来 的 额外 开销 。 

PKU (Protection Key Unit ) 技术 是 一 种 轻 量 级 的 内 存 隔离 机 制 。 以 Intel 的 Memory Protection Key (简称 MPK ) 
技术 为 代表 , 依靠 页 表 项 多 余 出 来 的 4 位 作为 key 值 给 页 面 “ 上 色 ” 的 方式 对 内 存 区域 按 页 粒度 进行 分 区 。MPK 添加 
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了 一 个 特殊 寄存 器 (PKRU) 来 记录 当前 程序 的 key (“ 色 号 ")， 当 被 访问 的 页 面 不 允许 当前 key 访问 时 就 会 检测 到 非 
法 访 存 。MPK 还 添加 了 特殊 指令 来 对 PKRU 进行 操作 。 这 样 就 用 较 少 的 硬件 开销 实现 了 内 存 隔离 。 但 是 MPK 本 号 
没有 成 体系 的 安全 机 制 来 保障 PKRU 不 被 算 改 ， 因 此 需要 对 库 函 数 的 二 进 制 进行 检查 确保 库 函 数 没有 修改 PKRU 的 
首 令 。 同 时 ，MPK 最 多 支持 16 个 key， 也 就 只 能 同时 存在 16 种 着 色 ， 这 对 有 大 量 隔离 需求 的 复杂 程序 来 说 是 远 远 不 


够 的 。 


3.3.2 ”CFI 方法 


控制 流 完整 性 技术 (Control Flow Integrity， 简称 CFD) 原本 是 需要 构造 程序 控制 流 的 完整 刻画 (比如 CFG), 但 
在 实际 应 用 技术 上 ， 共性 思路 是 采用 简洁 高 效 的 方式 保护 控制 流 关 键 数据 (比如 函数 指针 、 栈 上 的 返回 地 址 等 )， 以 及 


针对 间接 跳 转 的 目标 地 址 进行 限定 (比如 只 能 是 函数 入 口 等 )。 主 要 技术 包括 CET、BTI 以 及 PA 等 
CET(Control-How Enforcement Technology) 技术 是 英特尔 (Intel) 公司 开发 的 一 种 新 的 安全 技术 ， 主 要 通过 在 硬 
件 层面 上 保护 控制 流 ， 可 以 有 效 地 防止 针对 控制 流 进行 动 持 和 算 改 。CET 具体 实现 包括 两 种 机 制 : 


。 Indirect Branch Tracking (IBT): 主要 是 针对 JOP (Jump-Oriented-Programming) 和 ROP (Return-Oriented- 


Programming) 等 利用 间接 跳 转 的 攻击 。 它 通过 为 间接 跳 转 指 令 设置 着 加 


转 目 标 地 址 (比如 函数 入 口 地 址 )， 以 确保 跳 转 目标 的 合法 性 。 


址 。 


点 指令 来 限定 程序 中 合法 的 间接 跳 


。 Shadow Stack (SS) ， 它 通过 维护 一 个 额外 的 栈 来 跟踪 函数 调用 的 返回 地 址 : 在 函数 调用 时 把 返回 地 址 进行 人 
栈 ， 在 返回 时 对 返回 地 址 进行 弹出 同时 和 函数 返回 时 候 的 跳 转 目标 进行 对 比 ， 以 此 来 防止 攻击 者 算 改 返回 地 


BTI (Branch Target Identification) 是 ARMv8.5 增加 的 一 种 安全 特性 ， 也 是 针对 JOP 这 种 攻击 方式 。 和 IBT 


类似， 它 在 译 时 会 为 间接 跳 转 指 令 设 定 特定 位 置 对 BTI 指令 ， 以 此 来 规定 间接 跳 转 的 目标 ， 增 加 了 JOP 通过 间接 跳 


ig 将 程序 串联 在 一 起 进行 攻击 的 困难 。 


PA (Pointer Authentication) 技术 是 ARM 公司 一 项 指针 完整 性 校 验 技术 。PA 技术 利用 密码 学 完整 性 来 保护 返 


三 回 地 址 ， 同 时 出 于 节省 硬件 的 原则 ，PA 利用 了 虚 地 址 指针 中 的 空闲 高 位 。 在 编译 器 的 配合 下 ， 被 调用 函数 首先 计算 出 


ANI 


返回 地 址 的 校 验 码 ， 并 附 在 在 指针 高 位 中 ( 称 为 PAC，Pointer Authentication Code) ， 再 将 带 校 验 码 的 返回 地 址 压 和 


:二 乒 中 。 然后 在 函数 返回 前 插入 校 验 指 令 。 如 果 发 现 校 验 结果 和 PAC 不 一 样 ， 则 说 明 返 回 地 址 被 恶意 算 改 ,继而 触发 异 


“CE 溃 。 


- 忆 .3.3 ”安全 元 数据 保护 


现 有 的 地 址 空间 隔离 方法 存在 着 一 个 共性 的 问题 : 一 些 保护 机 制 在 使 用 安全 元 数据 (比如 MTE 的 tag 和 PKU 的 
key) 进行 防护 的 同时 ， 却 缺乏 对 安全 元 数据 的 保护 ， 导 致 恶意 程序 可 以 通过 修改 安全 元 数据 提升 自己 的 权限 或 者 取消 
隔离 限制 来 使 保护 机 制 失 效 。 例 如 针对 MPK 保护 机 制 , 程序 可 以 使 用 指令 随意 操作 PKRU 寄存 器 使 得 针对 自己 的 着 


色 保 护 失效 。 


针对 安全 元 数据 保护 问题 ， 有 大 量 的 研究 尝试 从 不 同方 面 进行 改进 ， 大 致 可 以 分 为 两 个 方向 : 


二 进 制 扫描 方法 : 这 种 方法 主要 通过 对 应 用 程序 或 者 非 可 信和 库 的 二 进 


出 代码 进行 检查 和 和 习 


E 写 ， 保 证 非 可 信 代 


码 不 能 存在 对 安全 元 数据 进行 修改 的 指令 (一 般 是 一 些 特殊 设计 的 指令 )。 例 如 学 术 界 提出 的 ERIM 方法 通 


过 二 进 制 扫描 防止 第 三 方 库 代 码 包含 对 PKRU 寄存 器 的 修改 指令 WRPKRU。 但 是 这 种 方式 对 于 一 些 动态 生 


成 的 代码 并 不 能 支持 。 


用 户 态 特权 函数 方法 : 这 种 方法 的 思想 是 在 用 户 态 中 构造 一 个 特权 函数 用 来 专门 进行 安全 元 数据 的 管理 和 操 


作 ， 在 这 个 函数 之 外 进行 的 安全 元 数据 操作 都 会 触发 例外 。 以 学 术 界 提出 的 Donky 为 例 : Donky 使 用 用 户 态 
中 断 的 方式 在 用 户 态 设置 一 个 安全 管理 函数 Domain Monitor， 所 有 对 PKRU 的 修改 只 能 在 这 个 函数 中 进行 ， 
在 这 个 之 外 使 用 WRPKRU 指令 则 会 触发 例外 。 同 时 Donky 对 于 跳 转 到 Domain Monitor 也 进行 了 控制 流 
限制 ， 防止 程序 通过 控制 流动 持 进 入 Domain Monitor 进行 PKRU 的 改写 。 这 种 方式 类 似 于 对 用 户 态 进一步 
进行 特权 集 划 分 ， 但 即使 是 轻 量 级 的 特权 级 划分 ， 也 可 能 由 于 频繁 的 特权 切换 而 带 来 的 性 能 开销 。 
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安全 元 数据 的 保护 往往 需要 DFI 和 CFI 结合 的 方式 。 首 先 这 些 元 数据 本 身 作为 私密 数据 需要 DFI 的 方法 提供 安 
全 隔离 ， 保 证 非 可 信 代 码 无 法 访问 和 算 改 。 其 次 需要 CFI 的 方法 保证 能 够 修改 这 些 私密 数据 的 代码 不 会 被 动 持 和 利用 
来 进行 恶意 修改 。 


3.4 ”设计 安全 方法 的 共性 问题 
我 们 针对 上 述 安 全 防护 机 制 进行 了 总 结 ， 认 为 针对 内 存 访问 漏洞 的 安全 机 制 在 进入 到 实用 阶段 时 ， 需 要 面临 以 下 
的 实际 问题 : 


3.4.1 ”防护 能 力 和 开销 的 权衡 


有 广泛 应 用 场景 的 处 理 器 安全 方案 不 可 避免 的 面临 性 能 /硬件 开销 和 防护 能 力 之 间 的 权衡 。 一 方面 ,一 些 防护 能 力 
强 的 机 制 可 能 会 由 于 频繁 的 检查 带 来 巨大 的 性 能 开销 (比如 MPX 技术 需要 针对 每 个 指针 访问 都 进行 权限 表 的 查询 , 使 
得 它 的 性 能 开销 非常 大 ) 。 基 于 特权 态 防 护 进行 的 安全 保护 可 能 需要 进行 大 量 特权 态 切 换 ， 也 会 带 来 不 小 的 性 能 开销 。 
另 一 方面 ， 一 些 软 硬 件 协同 的 安全 机 人 制 所 依赖 的 额外 的 安全 元 数据 可 能 会 导致 大 量 的 硬件 开销 ， 比 如 CHERI 对 指针 
进行 了 扩展 ， 指 针 变 量 的 存储 开销 增加 了 数 倍 ， 因 此 对 于 大 量 存在 指针 的 应 用 程序 可 能 会 导致 不 小 的 存储 和 访问 开销 。 
因此 ， 在 设计 安全 机 制 时 不 仅 需要 考虑 安全 性 问题 ， 还 需要 考虑 达到 这 个 安全 性 所 需要 的 代价 问题 。 


之 3.4.2 可 移植 性 问题 


一 些 安全 机 制 在 对 现 有 的 第 三 方 代码 库 进行 防护 时 ， 还 存在 着 重 写 困难 和 编译 困难 ， 这 导致 现 有 安全 机 制 的 可 移 
性 问题 。 许 多 学 术 工 作 通过 设计 添加 新 的 指令 或 者 扩展 指针 等 方式 来 实现 这 一 目标 。 然 而 这 些 工 作 更 改 了 程序 本 身 
一 的 运行 指令 和 指针 语义 ， 导 致 和 遗留 的 二 进 制 代码 库 不 兼容 。 如 果 要 使 用 这 些 安全 机 制 来 做 防护 需要 把 所 有 非 安全 的 
也 第 三 方 库 重新 进行 编译 ， 抛 开工 作 量 很 大 的 问题 ， 许 多 第 三 方 库 并 不 是 开源 的 ， 因 此 许多 安全 机 制 很 难 广泛 地 进行 应 
。 总 之 在 设计 安全 机 制 时 也 需要 考虑 可 移植 性 问题 。 


二 8.4.3 ”特权 切换 的 安全 检查 


DFI 和 CFI 一 般 是 在 同一 个 特权 级 内 部 ， 增 加 细 粒 度 的 防护 机 制 。 但是, 一旦 进行 特权 级 切换 ， 高 特权 级 的 代码 
往 拥 有 对 低 特权 级 代码 和 数据 的 修改 权限 。 因 此， 如 果 不 对 特权 级 切换 进行 一 定 的 限制 , 那么 DFI 和 CFI 的 保护 机 
= 市 可 能 通过 特权 调用 的 方式 破坏 。 上 典型 的 特权 级 调用 包括 系统 调用 、 虚 拟 机 陷入 等 。 其 中 系统 调用 是 应 用 程序 使 用 操 
-三 作 系 统 提供 功能 的 重要 接口 ， 但 也 可 以 被 非 可 信 代 码 利用 来 绕 过 安全 机 制 保护 。 比 如 在 MPK 保护 机 制 下 ， 代 码 可 以 
-利用 madvise 系统 调用 (原本 是 用 来 给 内 核 更 多 访 存 信息 来 提高 性 能 ) 来 清除 特定 内 存 页 中 的 内 容 ， 即 使 MPK 保护 
这 些 页 不 会 被 修改 。 代 码 还 可 以 通过 brk 和 sbrk 系统 调用 (原本 是 用 来 进行 堆 数 据 的 管理 ) 来 回收 和 重新 分 配 堆 上 的 
私密 数据 。 
因此 安全 机 制 除 了 数据 隔离 、 边 界 检查 和 控制 流 限 定 等 功能 外 ， 还 应 该 据 有 针对 系统 调用 等 特权 级 切换 进行 截获 
和 过 滤 的 功能 ， 来 防止 利用 特权 级 切换 进行 的 攻击 。 
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基于 上 述 针对 安全 方法 设计 面临 的 问题 ， 我 们 期 望 设 计 一 种 面向 同一 地 址 空间 内 的 应 用 ， 兼 顾 数据 流 完整 性 、 控 
制 流 完整 性 和 系统 调用 安全 性 的 高 效率 、 低 开销 、 可 移植 性 好 的 处 理 咒 安全 增强 技术 。 
攻击 模型 : 我 们 的 安全 处 理 器 设计 所 假设 的 攻击 模型 是 软件 内 部 可 以 分 为 具有 不 同 来 源 的 代码 片段 ， 其 中 包含 了 
软件 开发 者 所 编写 的 部 分 ， 这 部 分 代码 可 以 由 软件 开发 者 所 控制 ， 也 可 以 根据 新 需求 重新 编译 。 男 外 包括 了 第 三 方 库 
代码 部 分 ， 这 部 分 代码 可 能 来 源 于 闭 源 代码 生成 的 二 进 制 代 码 或 者 动态 生成 的 代码 ， 开 发 者 无 法 对 这 部 分 代码 的 源码 
进行 分 析 和 修改 。 我 们 将 这 部 分 代码 假设 为 非 可 信 代 码 ， 即 很 可 能 存在 可 以 被 利用 的 内 存 访问 漏洞 ， 其 至 可 能 还 包括 
通过 系统 调用 等 机 制 进行 特权 态 提升 的 危险 操作 。 攻 击 者 可 以 利用 这 些 漏洞 进行 控制 流 支持、 数据 自 改 以 及 关键 数据 
的 窃取 等 操作 。 
代码 即 主体 : 要 完成 一 个 地 址 空间 内 部 的 安全 隔离 ， 首 先 面 对 的 是 如 何 区 分 权限 主体 (subject) 的 问题 。 在 一 个 地 
址 空间 内 部 ， 传 统 的 进程 、 线 程 不 适合 作为 安全 主体 ; 单纯 以 函数 库 为 主体 粒度 也 太 大 ; 以 指针 或 指令 为 主体 粒度 又 
过 细 。 
我 们 注意 到 同一 个 程序 内 的 代码 片段 (地址 连续 的 一 段 代码 ) 可 以 作为 一 个 合适 的 权限 划分 的 主体 ， 例 如 一 个 库 
函数 内 部 存在 很 多 地 址 连续 的 代码 片段 ， 这 些 代码 片段 通常 用 来 实现 同一 个 功能 。 同 一 段 代码 在 特定 时 间 访 问 的 数据 
范围 是 确定 的 、 对 数据 的 操作 也 是 确定 的 ， 也 就 是 说 ， 可 以 对 这 段 时 间 里 的 不 同 代码 所 操作 的 数据 进行 空间 上 的 划分 
二 (比如 限定 指针 的 访问 范围 ) 以 及 操作 上 的 限制 (比如 限制 对 特定 地 址 的 读 / 写 ) 来 达到 特定 时 间 的 安全 隔离 。 同 时 我 们 
二 也 需要 随 着 时 间 迁 移动 态 地 来 做 划分 和 限制 来 保证 同一 代码 片段 在 不 同时 间 的 安全 隔离 (比如 同一 个 函数 可 能 被 多 次 
用 处 理 不 同位 置 的 数据 )。 另 外 我 们 还 需要 限制 这 些 代 码 片段 的 出 口 和 入 口 〈 比 如 函数 只 能 通过 调用 进入 .返回 退出 ， 
能 跳 转 到 中 间 开 始 或 者 结束 时 跳 转 到 非 调 用 者 代码 ) ， 达 到 限制 控制 流 的 目的 。 

所 以 我 们 选择 代码 片段 作为 安全 判定 的 主体 ， 即 所 谓 “代码 即 主体 ”(The code is the subject.)。 

动态 权限 : 基于 代码 为 主体 的 思想 , 我 们 设计 安全 机 制 的 基本 思路 是 , 调用 代码 片段 之 前 , 根据 预 设 或 推定 的 代码 
据 访 问 范围 ， 动 态 设 置 好 允许 访问 的 数据 边界 和 跳 转 目标 。 代 码 片段 在 允许 的 数据 范围 内 可 以 自由 访问 和 跳 转 ， 而 
且 发 生 越 界 访问 或 者 非法 跳 转 ， 就 触发 异常 阻止 访问 。 代 码 片段 执行 返回 后 ， 权 限 自动 回收 。 

动态 权限 划分 需求 表现 在 如 下 几 个 方面 : 


需要 进行 权限 的 动态 设置 和 分 配 ， 因 为 安全 资源 或 者 说 安全 元 数据 是 有 限 的 ， 而 复杂 程序 需要 对 数量 众多 的 
代码 片段 进行 隔离 和 划分 。 


需要 支持 不 同时 间 下 同一 段 代码 片段 的 不 同 权限 设置 ， 例 如 函数 A 在 第 一 次 是 被 可 信 代 码 调用 ， 这 时 可 以 访 
问 私密 数据 ， 但 是 第 二 次 是 被 非 可 信 代 码 调 用 ， 就 需要 禁止 函数 A 对 私密 数据 的 访问 。 


。 需要 应 对 不 能 进行 静态 划分 的 场景 , 例如 函数 指针 , 调用 者 在 调用 之 前 不 知道 这 个 函数 的 具体 行为 和 含义 , 就 
不 能 提前 推定 可 以 访问 的 数据 范围 。 


内 置 可 信 基 : 前 文 基于 安全 元 数据 的 问题 说 明 ， 安 全 资源 的 管理 需要 依靠 一 个 可 信 核 心 来 做 。 因 此 我 们 需要 一 个 
可 信 代 码 核心 〈( 可 信 基 ) 来 统一 做 权限 的 管理 和 元 数据 的 维护 ， 这 个 可 信 代 码 核心 需要 满足 一 些 基 本 特性 ， 比 如 可 信 
基本 身 需要 保证 本 身 不 会 或 者 至 少 很 难 被 攻击 ， 以 及 可 信 基 到 非 可 信 代 码 需要 高 效 的 转移 方式 以 降低 性 能 开销 。 可 信 
基 必 须 的 功能 如 下 : 


a 
. 


。 可 信 基 需要 有 分 配 和 回收 安全 资源 的 能 力 ， 以 支持 有 限 安 全 资源 下 对 不 同 代 码 片段 、 或 者 同一 代码 片段 不 同 
时 刻 的 安全 防护 ， 以 实现 动态 划分 。 


。 可 信 基 需要 在 控制 流转 移 到 非 可 信 区 之 前 ， 设 置 好 非 可 信 区 能 够 访问 的 数据 区 域 以 及 进行 的 操作 ， 保 证 数据 


流 完 整 性 。 
。 可 信 基 需要 对 自己 的 入 口 进行 限制 ， 防 止 非 可 信 区 通过 控制 流动 持 跳 转 到 可 信 区 修改 安全 元 数据 。 
可 信和 基 需 要 在 非 可 信 代 码 片 段 做 出 违反 权限 的 操作 时 ， 触 发 异常 进行 处 理 ， 可 选择 退出 或 者 修正 。 
可 信 基 需要 提供 一 系列 类 似 于 系统 调用 的 功能 ， 为 非 可 信 代 码 提供 本 身 能 访问 的 数据 和 功能 之 外 的 可 信 调 用 。 


~ 
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关于 可 信 基 的 实现 方法 ， 我 们 没有 采用 在 同一 地 址 空间 内 部 再 划分 特权 级 和 特权 态 的 方法 。 我 们 发 现 可 信 基 本 身 
也 可 以 作为 特殊 代码 片段 进行 管理 。 可 信 基 到 非 可 信 基 之 间 的 转移 不 需要 进行 复杂 的 特权 级 切换 ， 而 是 可 以 在 安全 规 
则 控制 下 直接 路 转 。 因 此 ， 可 信 基 实际 上 也 是 内 置 在 应 用 程序 中 的 一 个 代码 片段 。 

我 们 把 上 述 基于 代码 片段 做 权限 动态 划分 的 安全 处 理 器 设计 方案 ， 称 为 Dynamic in-Address-Space Isolation by 
Code Segments (DASICS )。 具 体 来 说 ，DASICS 方案 主要 由 包含 区 域 划分 、 代 码 权限 划分 设置 、 控 制 流 限 制 、 权 限 检 
查 、 权 限 例外 处 理 、 主 函数 调用 以 及 系统 调用 截获 等 儿 个 部 分 组 成 : 


4.1 区域 划 分 


DASICS 以 代码 片段 为 单位 进行 权限 划分 ， 具 体 的 代码 片段 含义 是 地 址 空间 连续 的 可 执行 代码 集合 〈 比 如 一 个 非 
inline 函数 内 的 代码 )。 代 码 片段 范围 可 以 通过 代码 起 始 和 结束 地 址 来 限定 。DASICS 遵循 高 权限 的 代码 片段 可 以 对 低 
权限 的 代码 片段 进行 权限 限制 的 原则 。 如 图 3 所 示 ， 这 种 限制 是 两 个 维度 上 的 : 

。 纵向 限制 : DASICS 支持 高 特权 级 代码 对 低 特 权 集 代码 进行 权限 设置 和 限制 。 例 如 RISC-V 架构 中 ，M 态 包 
可 信 区 可 以 对 S 态 的 可 信 区 进行 访问 限制 ，S 态 的 可 信 区 也 可 以 对 U 态 的 可 信 区 进行 访问 限制 。 


。 横向 限制 : DASICS 方法 将 同 特 权 态 下 的 程序 代码 划分 为 可 信 区 和 非 可 信 区 。 可 信 区 对 非 可 信 区 的 访问 权限 
进行 限制 。 比 如 在 用 户 态 中 ， 程 序 的 可 信 区 是 主 函 数 ， 而 非 可 信 区 则 是 第 三 方 库 函数 ， 主 函数 在 调用 库 函 数 
之 前 先 设置 其 权限 。 而 在 内 核 态 中 ， 可 信 区 是 内 核 调度 代码 ， 而 像 非 可 信 的 第 三 方 驱动 代码 就 会 被 放 到 非 可 
信 区 ， 内 核 在 使 用 这 些 非 可 信 驱 动 时 先进 行 权 限 设 置 。 


chinaXiv:202304.00955v1 


( 非 可 信 区 ) 


一 > 设置 权限 
一 > 非法 访问 


一 > 人 允许 访问 


图 3: DASICS 的 区 域 划 分 (横向 限制 + 纵向 限制 ) 


可 信 / 非 可 信 区 划分 目前 是 通过 人 工 标注 地 址 空间 来 决定 的 , DASICS 在 链接 时 会 将 可 信 代 码 片 段 放 到 静态 指定 的 
地 址 空间 里 完成 可 信 区 的 构建 。 除 此 之 外 其 他 地 址 空间 的 代码 则 被 认为 是 非 可 信 的 。 可 信 区 可 以 访问 同一 特权 级 的 所 
有 数据 ， 而 非 可 信 区 不 能 访问 可 信 区 的 数据 。 以 此 完成 不 同 权限 代码 的 访问 区 域 隔 离 。 


4.2 ”代码 权限 划分 

在 DASICS 中 , 代码 片段 的 权限 分 为 访问 权限 和 跳 转 权限 。 其 中 访问 权限 使 用 访问 数据 的 边界 来 划 定 , DASICS 在 
硬件 中 添加 了 几 组 边界 寄存 器 ， 每 组 寄存 器 描述 了 一 个 可 访问 区 域 的 范围 ， 以 及 可 以 对 这 个 区 域 进行 的 操作 ( 读 / 写 )。 
跳 转 权 限 同 样 也 有 跳 转 范 围 寄 存 器 来 规定 库 函 数 允 许 跳 转 的 目标 地 址 范围 。 


中 秽 外 时 候 ， 会 触发 同 特权 级 的 中 断 (例如 在 用 户 态 就 触发 用 户 态 中 断 ) 跳 转 到 例外 处 理 函 数 中 ， 并 读 取 硬 件 特权 寄存 
中 的 例外 原因 分 别 进行 不 同 的 处 理 ， 如 报错 退出 或 者 动态 对 权限 进行 修正 后 继续 执行 原 指 令 。 例 外 处 理 函 数 也 支持 


态 注册 ， 以 应 对 针对 不 同 场景 下 统一 例外 的 不 同 处 理 。 


C 
> 


.5 可 信 调 用 
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可 信 区 在 调用 非 可 信 区 代码 之 前 ， 首 先 分 配 边 界 寄 存 器 并 设置 好 非 可 信 区 代码 的 权限 ， 包 括 访 存 权 限 和 跳 转 权限 ， 
以 此 来 限定 非 可 信 区 代码 的 数据 流 和 控制 流 。 在 非 可 信 区 返回 之 后 ,对 边界 寄存 器 资源 进行 回收 。 在 控制 流 限制 上 ,， 除 
了 通过 跳 转 范围 寄存 器 划 定 非 可 信 区 可 以 访问 的 区 域外 ， 还 对 非 可 信 区 向 可 信 区 跌 转 的 入 口 进 行 了 限定 。 即 非 可 信 区 
只 能 通过 函数 返回 或 者 主 函数 调用 入 口 和 同 特 权 级 中 断 跳 转 到 可 信 区 代码 。 以 此 来 防止 可 信 区 代码 被 截获 利用 。 


4.3 权限 检查 


DASICS 的 访 存 权 限 检查 会 设置 于 处 理 器 取 指 单元 和 访 存单 元 中 。 当 非 可 信 区 的 代码 发 生 访 存 ( 包 括 取 指 / 读 取 / 写 
入 ) 时， 使 用 访 存 地 址 到 边界 寄存 器 中 检查 是 否 访问 了 允许 范围 之 外 的 地 址 、 是 否 对 地 址 空间 进行 了 不 允许 的 访 存 操 
作 (执行 / 读 / 写 )。 如 果 发 现 超越 权限 的 访 存 操作 (地址 越界 或 者 无 操作 权限 )， 则 会 触发 同 特权 级 中 断 进行 进一步 的 
处 理 (比如 报错 退出 )。 

控制 流 限 制 的 检查 会 在 跳 转 指令 执行 时 进行 检查 。 主 要 是 检查 可 信 区 进行 非 可 信 区 函数 调用 的 控制 流 : 当 程 序 控 
制 流通 过 函数 调用 方式 从 可 信 区 代码 转移 到 非 可 信 区 代码 时 ， 在 可 信 区 代码 里 的 函数 返回 地 址 会 被 记录 下 来 。 等 到 非 
可 信 区 代码 返回 时 ， 对 比 实 际 的 返回 地 址 和 记录 里 的 返回 地 址 ， 若 不 一 致 说明 返 回 地 址 可 能 被 非 可 信 代 码 自 改 ， 此 时 
会 触发 中 断 报错 退出 。 

基于 以 上 权限 检查 ，DASICS 可 以 防止 恶意 代码 进行 诸如 数组 越界 访问 (buffer overflow) 以 及 修改 返回 地 址 的 控 


一 制 流动 持 (Control-flow hijack) 攻击 。 


-4 同 特 权 级 例外 处 理 
DASICS 支持 可 信 区 注册 例外 处理 函数 ， 以 处 理 访问 例外 或 者 控制 流 例外 等 。 根 据 上 述 权 限 检 查 的 描述 ， 当 发 生 


和 操作 系统 的 系统 调用 的 思想 类 似 ，DASICS 在 限制 非 可 信 区 的 数据 访问 的 同时 ， 也 会 提供 可 信 调 用 给 非 可 信 区 


< 非 行 可 访问 范围 之 外 的 可 信 操 作 。 原 因 是 可 能 存在 可 信 区 代码 提前 设置 好 的 数据 范围 不 足以 支撑 非 可 信 区 代码 完成 其 
功能 的 情况 。 例 如 用 户 态 中 一 个 库 函 数 需 要 增加 自己 的 数据 访问 权限 或 者 需要 更 大 的 数据 区 域 时 ， 就 可 以 通过 主 函 数 


汪 油 用 返回 到 主 函数 里 更 新 边界 寄存 器 ， 再 返回 到 库 函 数 进行 执行 。 
0 ”为 了 支持 可 信 调 用 ， 可 信 区 需要 首先 注册 可 信 调 用 的 入口 地 址 以 增加 合法 的 可 信 区 入 口 。 非 可 信 区 代码 可 以 和 系 


“ 统 调用 一 样 设置 好 可 信 调 用 的 参数 ， 然 后 直接 跳 转 到 这 个 人 口 进行 可 信 调 用 。 后 面 这 一 点 比 系统 调用 更 加 快速 ， 因 为 
并 不 需要 耗 时 间 的 特权 级 切换 。 


4.6 系统 调用 截获 


为 了 防止 利用 路 特权 级 调用 进行 的 攻击 ，DASICS 中 加 入 了 对 系统 调用 的 截获 。 硬 件 会 设置 观测 逻辑 ， 一 旦 捕捉 
到 系统 调用 指令 (例如 RISC-V 架构 中 的 ecall 指令 )， 就 触发 用 户 态 中 断 跳 转 到 可 信 区 例外 处 理 函 数 。 例 外 处 理 函 数 
根据 例外 原因 (用 户 态 系 统 调用 例外 ) 再 跳 转 到 系统 调用 例外 处 理 函 数 ， 这 个 函数 中 可 以 针对 本 次 系统 调用 进行 一 些 
安全 检查 ， 比 如 检查 这 个 代码 片段 是 否 能 进行 这 个 系统 调用 、 检 查 系统 调用 的 参数 是 否 越过 了 这 个 代码 片段 的 权限 范 
围 以 及 对 一 些 非 安全 的 系统 调用 进行 代理 (复制 系统 调用 的 参数 之 后 由 主 函 数 来 代理 进行 系统 调用 )。 在 应 用 内 部 进行 
系统 调用 检查 还 可 以 更 有 针对 性 的 对 各 种 文件 、 设 备 资 源 进行 细 粒 度 的 管理 。 


4.7 DASICS 方案 的 优势 
相 较 于 之 前 针对 内 存 访问 漏洞 的 安全 保护 机 制 ， 我 们 认为 DASICS 方案 的 优势 在 于 : 
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提供 全 面 的 保护 : DASICS 通过 不 同 权 限 主体 的 内 存 隔离 来 保证 数据 流 完 整 性 (DFI)， 通 过 函数 调用 和 返回 
的 配对 检查 来 保证 控制 流 完整 性 (CFI)。 同 时 提供 了 数据 流 和 控制 流 两 个 方面 的 保护 并 互相 支持 ， 除 了 对 应 
用 数据 提供 保护 外 ， 安 全 元 数据 本 身 被 修改 的 风险 也 很 小 。 


提供 高 效率 保护 : DASICS 的 可 信 区 到 非 可 信 区 之 间 的 转移 是 直接 的 跳 转 , 不 需要 像 Donky 等 保护 机 制 通过 
中 断 的 方式 进行 切换 ， 更 可 以 避免 频繁 进出 内 核 、 管 理 态 等 来 实现 完整 的 安全 保护 机 制 。 


提供 细 粒 度 的 保护 : DASICS 通过 动态 基于 边界 寄存 器 的 访问 范围 划分 来 达到 对 指针 的 访问 限制 ， 相 较 于 基 
于 页 粒度 的 保护 机 制 (如 MPK) 提供 了 更 精细 的 保护 粒度 。DASICS 的 代码 片段 , 不 依赖 某 种 硬件 设置 的 id 
或 tag 等 进行 区 分 ， 可 以 进行 更 细 粒 度 的 权限 划分 。 


提供 动态 的 保护 : DASICS 通过 可 信 区 的 动态 设置 实现 了 区 域 的 动态 划分 ， 通 过 安全 资源 (访问 边界 寄存 器 
和 跳 转 范围 寄存 器 ) 的 分 配 和 回收 实现 了 权限 的 动态 划分 。 实 现 了 不 同 场景 下 根据 需求 进行 的 动态 、 灵 活 的 
保护 ， 可 以 支持 具有 时 效 性 的 安全 规则 。 


提供 多 特权 级 的 保护 : DASICS 支持 多 级 特权 态 的 安全 防护 (内核 态 、 用 户 态 )， 不仅 可 以 用 于 用 户 态 代码 的 
保护 ( 见 6.1 Use Case 1)， 还 可 以 进行 内 核 代 码 的 防护 ( 见 6.2 Use Case 2) 


i 有 很 好 的 可 移植 性 : DASICS 保护 机 制 下 ， 用 户 只 需要 将 第 三 方 库 划 分 到 安全 区 ， 而 不 需要 对 第 三 方 库 进行 
重新 编译 ， 降 低 了 第 三 方 库 代码 的 重 编译 困难 。 在 可 以 修改 源码 的 情况 下 ， 只 需要 在 函数 出 入 口 增加 简单 的 
API， 就 可 以 实现 进一步 的 安全 增强 。 
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5 原型 1.0 的 实现 


我 们 基于 上 述 设计 思路 实现 了 DASICS 的 原型 1.0， 包 括 硬件 和 软件 原型 。 硬 件 部 分 基于 国内 开源 的 RISC-V 处 
理 器 NutShell 实现 ， 软 件 部 分 则 是 基于 BBL(Berkeley BootLoader) 与 Linux 4.18.2 进行 了 修改 。 


5.1 硬件 实现 


DASICS 硬件 部 分 基于 开源 RISC-V 架构 处 理 器 NutShell 实现 。 在 NutShell 顺序 核 的 六 级 流水 线 结构 中 ， 我 们 
添加 了 对 DASICS CSR、DASICS 例外 和 DASICS 新 指令 的 支持 ， 涉 及 到 的 模块 主要 包括 译 码 模块 (IDU)、CSR 执 
行 模块 和 访 存 模块 (LSU) 等 ， 总 共 改 动 的 chisel 代码 行 数 不 超 过 500 行 。 

对 于 DASICS CSR 而 言 ， 我 们 在 CSR 模块 中 新 增 了 如 下 表 所 示 一 共 43 个 位 宽 为 64 bits 的 逻辑 CSR 寄存 髓 ， 
用 来 支持 DASICS 的 安全 防护 功能 。 


DASICS CSR 名 称 CSR 编号 功能 
dsmcfg & dumcfg 0xBC0 & 0x5C0 | S 态 /U 态 主 函数 配置 寄存 器 


dsmbound0 & dsmboundl | 0xBC1 & 0xBC2 S 态 主 函数 边界 寄存 器 
dumbound0 & dumboundl | 0x5C1 & 0x5C2 U 态 主 函数 边界 寄存 器 


dlcfg0 & dlcfgl 0x881 & 0x882 库 函 数 配 置 寄存 器 
dlbound0 ... dlbound31 0x883 ... Ox8A2 库 函 数 边界 寄存 器 
dmaincall 0x8A3 主 函数 调用 入 口 地 址 
dretpc 0x8A4 库 函 数 返 回 地 址 
dretpcfz 0x8A5 活跃 区 返回 地 址 


dsmcfg 与 dumcfg 共用 一 个 物理 CSR. 寄存 器 , 用 于 使 能 DASICS 对 于 $ 态 /U 态 的 保护 , 并 且 设 置 了 5 态 /U 
态 的 清 零 位 ， 以 降低 软件 切换 上 下 文 时 的 开销 。 


dsmbound0/1 和 dumbound0/1 分 别 划 定 了 S$ 态 和 U 态 的 可 信 区 边界 ， 不 在 这 个 边界 范围 内 的 都 为 非 可 信 
区 。 


dlcfg 为 库 函 数 配置 寄存 器 , 每 个 dlcfg 内 都 包含 着 8 个 4 位 的 tiny config (奇数 索引 的 tiny config 为 全 零 不 
使 用 ), 而 每 个 tiny config 都 对 应 着 一 组 dlbound, 表示 这 组 库 函 数 边界 内 的 代码 片段 具有 哪些 权限 ( 读 / 写 /可 
执行 )。dlcfg 与 dibound 一 起 组 成 了 一 个 DASICS 库 函 数 查找 表 ， 用 于 判断 是 否 发 生 了 DASICS 例外 。 


dmaincall 存储 主 函 数 调用 的 和 人口 地 址 ， 库 函数 跳 转 到 该 地 址 的 行为 是 被 允许 的 。 


dretpc 记录 了 库 函 数 调 用 完成 后 ， 人 允许 其 返回 的 目标 地 址 。 当 主 函 数 使 用 跳 转 指令 或 者 分 支 指令 跳 转 到 库 函 
数 时 ， 跳 转 指令 的 下 一 条 指令 的 地 址 将 会 被 硬件 自动 填 信 dretpc 中 。 


dretpcfz 为 活路 区 返回 地 址 ， 所 谓 活跃 区 是 指 非 可 信 区 代码 中 ， 外 部 允许 跳 转 到 的 内 部 任意 代码 ， 但 是 该 内 
部 的 代码 只 能 通过 函数 返回 跳 转 到 外 部 的 代码 区 域 。 这 个 机 制 是 对 艇 套 的 非 可 信 区 调用 所 做 出 的 进一步 限制 


为 了 防止 非 可 信 区 内 的 代码 通过 修改 上 述 CSR 寄存 器 来 使 DASICS 保护 功能 失效 ，DASICS 机 制 也 为 读 写 CSR 
寄存 右 设 置 了 新 的 限制 ， 即 仅 允许 可 信 区 内 的 代码 访问 特权 态 允 许 的 DASICS CSR 寄存 器 。 例 如 对 于 dsmbound0/1 
而 言 ， 仪 允许 M 态 、S 态 主 函数 对 其 进行 读 写 ; 对 于 dlcfg 而 言 ， 则 仪 允 许 M 态 、S 态 主 函数 、U 态 主 函 数 对 其 进行 
读 写 。 

为 了 实现 发 现 DASICS 访问 或 者 跳 转 违例 时 触发 例外 的 功能 ， 以 及 进行 系统 调用 支 持 ， 我 们 新 增 了 如 下 表 所 示 的 
8 种 DASICS 例外 : 


。 对 于 DASICS S 态 /U 态 执行 例外 而 言 ， 当 非 可 信 区 函数 跳 转 到 可 信 区 的 跳 转 目标 地 址 不 等 于 dretpc 或 者 
dmaincall 时 ， 或 是 非 可 信 活 跃 区 函数 想 要 跳 转 到 返回 地 址 之 外 的 地 址 时 ， 亦 或 是 非 可 信 区 代码 跳 转 到 边界 寄 
存 右 所 允许 的 跳 转 范围 时 ， 引 发 该 例外 。 
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DASICS 例外 名 例外 号 描述 
DASICS _U/S INST FAULT | 0xl8 / 0x19 | UU 态 /S 态 跳 转 例外 
DASICS _U/S LOAD FAULT | 0xla / 0xlb | JU 态 /S 态 无 读 权限 

DASICS_U/S_STORE FAULT | 0xlc / 0xld | UU 态 /S 态 无 写 权 限 
DASICS_U/S_ECALL FAULT | 0xle / 0xlf | U 态 /S 态 系统 调用 例外 


。 对 于 DASICS S 态 /U 态 访 存 例外 而 言 ， 当 非 可 信 区 试图 访问 允许 的 访 存 范围 外 的 地 址 ， 即 访 存 地 址 与 读 写 
标记 在 DASICS 库 函 数 查找 表 中 没有 匹配 项 时 ， 则 根据 当前 指令 是 load 还 是 store 分 别 引发 对 应 特权 态 下 的 
DASICS 读 / 写 访 存 例外 。 同时, 当 该 例外 发 生 时 , 需要 取消 掉 LSU 模块 中 正 要 发 送 给 AXI 总 线 的 访 存 请 求 。 


。 对 于 DASICS S 态 /U 态 系统 调用 例外 而 言 ， 如 果 发 现 当 前 指令 是 一 条 RISC-V 系统 调用 指令 ( 即 ecall 指令 ) 
就 甬 发 该 例外 ， 在 例外 函数 中 进行 系统 调用 的 截获 检查 。 


在 NutShell 的 指令 译 码 模块 中 ， 我 们 添加 了 dasicsret 这 一 新 增 指令 的 译 码 逻辑 。 该 指令 的 设计 参考 了 JALR 指 
令 ， 但 与 之 不 同 的 一 点 在 于 ，dasicsret 指令 仅 允 许 主 函 数 调用 。 
此 外 , 为 了 加 速 软件 对 DASICS 例外 的 处 理 流程 , 我 们 在 NutShell 上 按照 RISC-V N 扩展 的 草案 (版 本 1.1) 实现 
二 一 了 RISC-V 架构 的 NN 扩展 ， 从 而 可 以 通过 配置 medeleg/sedeleg 将 DASICS 例外 代理 到 用 户 态 进行 处 理 。 当 DASICS 
三 例外 被 代理 到 用 户 态 之 后 ， 其 例外 处 理 流 程 如 图 所 示 。 


设置 用 户 态 中 断 处 
理 函 数 入 口 


执行 内 核 中 断 


到 4: DASICS 的 例外 处 理 流 程 


5.2 ”软件 实现 


在 BBL 中 ,我 们 增加 了 DASICS 机 制 的 初始 化 ， 包 括 设置 DASICS 例外 的 代理 ， 以 及 设置 dsmbound 为 全 内 存 
空间 。 后 者 这 样 做 的 原因 是 : (1) BBL 无 法 确定 S 态 可 信 区 的 大 小 ; (2) BBL 完成 初始 化 之 后 会 跳 转 到 S 态 可 信 区 
中 ， 由 S 态 可 信 区 通过 新 增 的 SBI 调用 来 修改 dsmbound。 同 时 ， 我 们 也 在 BBL 中 增加 了 修改 dsmbound 的 SBI 调 
用 , 该 SBI 调用 仅 能 由 $ 态 可 信 区 调用 ， 和 否则 会 直接 报错 返回 。 

在 Linux 中 ， 我 们 增加 了 DASICS 例外 处 理 的 逻辑 ， 并 且 将 DASICS 机 制 运用 到 用 户 程序 的 ELF 加 载 中 。 对 于 
前 者 而 言 ， 我 们 在 linux 原本 的 例外 处 理 流 程 中 增加 了 保存 恢复 DASICS 程序 上 下 文 的 逻辑 ,并 且 将 DASICS U 态 例 
外 代理 到 用 户 态 处 理 。 与 此 同时 ， 我 们 在 linux 中 提供 了 默认 的 主 函 数 调用 入 口 函 数 ， 以 及 默认 的 DASICS 用 户 态 例 
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外 处 理 函 数 。 对 于 用 户 程序 的 ELF 加 载 而 言 ， 我 们 主要 修改 了 fselfc， 通 过 识别 用 户 程序 中 的 dasics 分 区 ， 从 而 填写 
dumbound 寄存 器 以 设置 用 户 程序 的 主 函 数 区 域 。 
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6 DASICS 应 用 场景 举例 
本 章 介绍 几 个 可 能 的 通过 DASICS 高 效 的 提高 系统 安全 性 的 应 用 实例 。 


6.1 Use Case 1: 可 信 区 Rust 十 非 可 信 C 代码 库 


前 文 已 经 提 到 , 通过 以 Rust 为 代表 的 安全 编程 语言 进行 编程 可 以 解决 大 部 分 的 内 存 漏洞 , 但 是 这 类 安全 编程 语言 
开发 复杂 ， 移 植 困难 ， 将 现 有 的 所 有 程序 代码 都 用 安全 语言 进行 改写 会 带 来 巨大 的 工作 量 。 加 入 DASICS 之 后 ， 开 发 
人 员 可 以 使 用 安全 语言 构建 可 信 区 代码 ， 然 后 其 他 的 非 可 信 库 代码 使 用 DASICS 机 制 进 行 限制 。 这 样 既 保证 了 可 信 区 
代码 本 身 不 会 出 现 内 存 漏 洞 ， 也 大 大 降低 了 改写 的 工作 量 。 非 可 信 区 的 代码 权限 通过 DASICS 机 制 在 可 信 区 进行 了 限 
制 ， 从 而 大 大 降低 了 非 可 信 区 中 可 能 存在 的 安全 漏洞 带 来 的 危害 。DASICS 机 制 通过 对 硬件 寄存 器 的 操作 实现 对 安全 
权限 的 设置 ， 与 编程 语言 无 关 ， 因 此 可 以 支持 各 种 编程 语言 ， 并 提供 灵活 的 安全 设置 。 


6.2 Use Case 2: 内 核 保护 十 第 三 方 驱动 


现 有 的 许多 安全 手段 都 依赖 一 个 安全 的 内 核 ， 通 过 在 内 核 中 设置 某 些 安全 权限 数据 ， 从 而 实现 对 用 户 态 程序 的 安 
全 检查 或 限制 。 但 是 内 核 态 本 身 可 能 也 运行 着 大 量 的 第 三 方 代码 ， 包 括 文件 系统 、 设 备 驱动 、 网 络 协议 栈 等 内 核 模块 。 
本 这 些 模块 本 身 对 于 操作 系统 的 开发 者 来 说 并 不 属于 可 信任 的 代码 ， 从 而 存在 安全 隐患。 第 三 方 模块 和 内 核 代码 都 运行 
三 在 特权 级 ,一 旦 操作 系统 内 核 本 身 的 安全 Sad 当前 大 量 的 安全 防护 手段 都 将 失效 。 通过 DASICS 机 制 , 我 们 可 以 
操作 系统 中 也 加 入 可 信 区 与 非 可 信 区 的 隔离 。 系 统 开发 者 可 以 将 第 三 方 的 模块 代码 都 加 入 内 核 空间 的 非 可 信 区 ， 并 
制 它们 的 执行 访问 权限 ， 从 而 避免 第 三 方 内 核 模块 带 来 的 操作 系统 安全 风险 。DASICS 机 种 通过 硬件 实现 安全 保护 
制 ， 从 而 可 以 支持 内 核 地 址 的 隔离 与 保护 ， 既 不 会 破坏 原本 的 内 核 态 与 用 户 态 的 隔离 ， 又 在 内 核 态 增加 了 新 的 隔离 
叫 。 


\6.3 Use Case 3: single level OS (LibraryOS ) 


C 在 云 计算 等 场景 中 ， 应 用 程序 往往 不 需要 复杂 的 操作 系统 功能 ， 而 复杂 的 操作 系统 又 会 降低 整个 系统 运行 的 效率 。 

-> 因此 ，LibraryOS 或 Unikernel 的 概念 被 提出 ， 通 过 将 应 用 程序 需要 的 操作 系统 功能 变 成 用 户 态 库 的 方式 给 应 用 程序 
C ,< 使 用 ， 从 而 减少 了 复杂 操作 系统 带 来 的 开销 ， 且 提高 了 应 用 程序 的 平台 适 配 度 。 但 是 这 样 的 方案 获得 性 能 的 同时 失去 
6G 了 传统 操作 系统 的 安全 性 ， 即 内 核 态 与 用 户 态 的 隔离 。 为 了 达到 足够 的 安全 性 ， 又 必须 再 引入 额外 的 手段 实现 轻 量 级 
.的 隔离 机 制 。 如 果 LibraryOS 加 入 DASICS 功能 之 后 ， 可 以 限制 用 户 程序 的 访 存 权限 ， 并 且 可 以 以 函数 为 粒度 进行 限 
<- 制 ， 从 而 隔离 LibraryOS 中 应 用 程序 与 内 核 功能 的 代码 ， 避 免 一 定 的 安全 隐患 。 相 比 于 基于 多 个 保护 态 切换 的 保护 机 
一 制 ，DASICS 的 性 能 开销 更 小 ， 从 而 可 以 保持 LibraryOS 原本 的 性 能 优势 不 被 破坏 。 
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